前文
在了解了RCNN後,會發現RCNN中的的Selective Search處理一張圖片就要花上2秒,與real-time的目標相差甚遠,所以今天的文章將要介紹將RCNN優化過後的的Fast RCNN。
Fast RCNN
R-CNN計算2000個Region proposal放入CNN需要個別運算很多重複的區域,而Fast RCNN就只算了一次CNN,再將CNN擷取出來的特徵讓2000個Region proposal做運用,再利用RoIpooling (Region of Interest Pooling)的將取出的Region對應到Feature map輸出後各自接上FC去做softmax分類及bbox regressor。
重點
1.Fast RCNN一樣需要使用Selective Search選出1000~2000個Region proposal。
2.只需要計算一次CNN,利用RoIpooling對應到Feature map,因為region proposal的xyhw通常是小數,因此在對應Feature map之前會先取一次整數,整數化後的邊界平均分割成kxk個單元,對每一個單元的邊界做整數化如下圖,經過取整數之後,特徵位置和feature map 所對應的位置就會有所偏差,後來就演進了RoIAlign。
圖片來源
https://ccshenyltw.medium.com/object-detection-r-cnn-fast-rcnn-faster-rcnn-mask-rcnn-retinanet-to-be-continued-71b67640445
參考資料
https://ccshenyltw.medium.com/object-detection-r-cnn-fast-rcnn-faster-rcnn-mask-rcnn-retinanet-to-be-continued-71b67640445
https://ivanfang.coderbridge.io/2021/06/17/fang-faster-rcnn/